روش جدید و مقاوم پیش پردازش جهت بهبود تکنیک های داده کاوی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
- نویسنده الاهه براتی
- استاد راهنما محمد رضا احمدزاده
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
درسال های اخیر، توانایی تولید و جمع آوری داده افزایش چشم گیری داشته و حجم داده با سرعت زیادی رو به افزایش است. داده کاوی یا اکتشاف دانش از پایگاه های داده، به معنای فرآیند استخراج غیربدیهی اطلاعات ضمنی (غیرصریح) است که قبلاً برما پوشیده بوده و احتمالاً مورد استفاده و با ارزش خواهند بود. با وجود این، اغلب الگوریتم های داده کاوی نمی توانند به طور مستقیم روی داده های ذخیره شده در این پایگاه های داده کارکنند. اغلب روش های داده کاوی موجود گزاره ای بوده و الگوها را فقط از یک جدول ساده استخراج می کنند. درواقع، حضور همه داده ها در یک جدول ضروری است. بنابراین، برای استفاده از الگوریتم های داده کاوی یک مرحله پیش پردازش لازم است که متاسفانه منجر به از دست دادن بعضی از اطلاعات باارزش می شود. یکی از روش های کاوش پایگاه داده های رابطه ای برنامه نویسی منطق استقرائی است. در استفاده از برنامه نویسی منطق استقرائی لازم است داده ها به فرم عبارت های منطقی باشند و این امر به پیش پردازش زیادی احتیاج دارد. از روش های دیگر می توان به شبکه های بیزین، شبکه های عصبی، داده کاوی رابطه ای روی پایگاه داده رابطه ای و پایگاه داده رابطه ای به عنوان مجموعه ای از درخت ها اشاره کرد. در این تحقیق با بررسی روش های موجود، روش پایگاه داده رابطه ای به عنوان مجموعه ای از درخت ها انتخاب شد. با تبدیل پایگاه داده رابطه ای به درخت، امکان استفاده از الگوریتم های کاوش درخت برای استخراج الگوهای مختلف فراهم می شود. در این تحقیق با ترکیب دو طرح موجود در روش تبدیل پایگاه داده رابطه ای به درخت که مبتنی بر کلید و شیء بودند، ساختار جدیدی ارائه گردید. با استفاده از درخت های تولید شده در روش پیشنهادی و اعمال دو الگوریتم مختلف کاوش درخت، الگوهای تکراری تولید شده از ساختار مبتنی برکلید بیشتر و از ساختار مبتنی برشیء کمتر بودند. به علاوه، با اعمال تغییراتی در ساختار نمایش درخت توانستیم از این ساختار برای دسته بندی استفاده کنیم. در این تحقیق روش پیشنهادی روی یک مجموعه داده پزشکی به عنوان مطالعه موردی اعمال شد. یکی از چالش های استفاده از داده کاوی روی داده های پزشکی مسئله مقادیرگمشده است. بنابراین در این تحقیق پس از اعمال روش های مختلف مقابله با مقادیرگمشده، بهترین روش انتخاب شد و روی مجموعه داده اعمال گردید. سپس با استفاده از الگوریتم های کاوش درخت، الگوهای تکراری براساس مقادیر تائید متفاوت تولید گردیدند. از این الگوها برای استخراج قوانین مختلف استفاده شد. قوانین استخراج شده می توانند با فراهم کردن اطلاعات مفید، به پزشکان در رابطه با تشخیص بیماری کمک نمایند.
منابع مشابه
استفاده از تکنیک های داده کاوی جهت تشخیص دیابت با استفاده از چربی خون
مقدمه: بیماری دیابت یکی از شایع ترین، خطرناک ترین و پرهزینه ترین بیماری های حال حاضر دنیا است که با نرخ هشدار دهنده ای در حال افزایش است. استفاده از روش های داده کاوی می تواند به تشخیص زودهنگام دیابت کمک کند که باعث جلوگیری از پیشرفت این بیماری و خیلی از عوارض آن مانند بیماری قلب و عروق، مشکلات بینایی و بیماری های کلیوی می شود. مواد و روش ها: در این تحقیق از نرم افزار داده کاوی رپیدماینر برای...
متن کاملپیش بینی بیماری قلبی با استفاده از تکنیک داده کاوی شبکه عصبی
مقدمه داده کاوی به بررسی و تجزیه و تحلیل مقادیر عظیمی از داده ها به منظور کشف الگوها و قوانین معنی دار اطلاق میشود که عمدتا" از طریق ساختن مدل ها و الگوریتم ها، ورودی ها را با هدف خاصی مرتبط می نماید. گاهی تکنیک های داده کاوی منجر به شناسایی الگوریتم های معنادار می شوند که می توانند با استفاده از داده های موجود و در دسترس و با هزینه کم، زمینه های ابتلا، پیشگیری و درمان بیماری ها را در پزشکی فرا...
متن کاملپیش بینی عود مجدد سرطان پستان به کمک سه تکنیک داده کاوی
مقدمه: تعداد و اندازه پایگاه داده های پزشکی به سرعت در حال افزایش است و مدل های توسعه یافته تکنیک داده کاوی می توانند برای پزشکان جهت کمک در تصمیم گیری موثر و کاربردی باشند. هدف اصلی از این مقاله، گزارش یک پروژه تحقیقاتی به منظور مقایسه الگوریتم های مختلف داده کاوی از طریق مقایسه حساسیت، ویژگی و دقت بین آنها، جهت انتخاب دقیق ترین مدل برای پیش بینی عود مجدد سرطان پستان در زنان مبتلا بوده است. د...
متن کاملپیش بینی روش درمان بیماری قلبی با استفاده از الگوریتم های داده کاوی
Background and Aim: Nowadays heart disease is very common and is a major cause of mortality. Proper and early diagnosis of this disease is very important. Diagnostic methods and treatments of the disease are so expensive and have many side effects. Therefore, researchers are looking for cheaper ways to diagnose it with high precision. This study aimed to identify a model for the treatment of he...
متن کاملپیش بینی نوع اظهارنظر حسابرسان با رویکردی بر روش های داده کاوی
روش های داده کاوی می تواند حسابرسان را در ارائه اظهارنظر حسابرسی یاری رساند. هدف این پژوهشپیش بینی نوع اظهارنظر حسابرسان با استفاده از رو شهای داده کاوی و مقایسه عملکرد این روش ها است. بدینمنظور از روش های شبکه عصبی مصنوعی، ماشین بردار پشتیبان، نزدی کترین همسایگی و درخت تصمیم استفادهشده است. نمونه مورد بررسی شامل 842 مشاهده طی سال های 1380 تا 1389 بوده که این مشاهدات به دو قسمتتقسیم شده است، قس...
متن کاملپیش بینیِ خرابی و برنامه ریزیِ نگهداری و تعمیرات خودپردازهای بانکی با روش داده کاوی
پایانههای خودپرداز به عنوان اولین و پر تقاضاترین کانالهای بانکداری الکترونیک در صورت عدم سرویس دهی به عنوان تهدید برای بانکها قلمداد می گردد. از سوی دیگر داده های مربوط به تعمیرات و نگهداری خودپردازها به طور چشمگیر گسترده شده است.در این راستا داده کاوی برای افزایش مشهود نرخ تبدیل داده ها به اطلاعات و کشف دانش به منظور جلوگیری از توقف دستگاه خواهد بود. هدف از مقاله حاضر ارائه معماری دسته بندی ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023